Préférences continues pour la Sélection d’Actions
نویسندگان
چکیده
Dans cet article, nous avons expérimenté l’utilisation d’alternatives continues pour la sélection des actions d’un agent orienté comportement. Un tel agent est constitué de "comportements" concurrents, chacun de ces comportements réagit à des stimuli spécifiques et propose une action, en accord avec un but élémentaire. Comme les comportements sont spécialisés, ils peuvent proposer des actions concurrentes et en conflit avec les autres actions, alors qu’il est nécessaire de déterminer un comportement global cohérent de l’agent. Dans ce contexte, les méthodes de vote permettent de sélectionner une action parmi celle proposées par les comportements, tout en tenant compte de leurs préférences et en respectant leur contraintes. Les travaux précédents sont basés sur des espaces d’action limités à quelques valeurs discrètes, et la détermination des poids des votes des comportements est difficile. De plus ces travaux ne permettent pas en général d’exprimer l’indifférence en une des composantes des alternatives, c’est-à-dire le fait qu’un comportement n’ait pas de préférence sur la valeur d’une des composante de l’action. Nous proposons dans cet article une méthode permettant d’utiliser des domaines continus dans les alternatives, et une méthode de vote plus équitable que dans les travaux précédents. Notre approche permet également l’expression de l’indifférence entre alternatives. Cette proposition a été testée et comparée, les résultats montrent que cette méthode permet de mieux éviter les situations de blocage.
منابع مشابه
Sélection de modèles et sélection d'estimateurs pour l'Apprentissage statistique (Cours Peccot) Quatrième cours: Validation croisée et pénalités reliées
1. Validation croisée 1 1.1. Principe et dé nition générale 2 1.2. Exemples 2 1.3. Estimation du risque par validation croisée 4 2. Validation croisée pour la sélection d'estimateurs 5 2.1. Sélection d'estimateurs pour la prédiction 5 2.2. Sélection d'estimateurs pour l'identi cation 6 2.3. Choix d'une méthode de validation croisée 6 2.4. Limites de la validation croisée 6 3. Détection de ruptu...
متن کاملSélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Premier cours: Apprentissage statistique et sélection d’estimateurs
1. Le problème de l’apprentissage statistique 2 1.1. Cadre général 2 1.2. Exemple : prédiction 2 1.3. Exemple : régression 2 1.4. Exemple alternatif : régression sur un plan d’expérience fixe 3 1.5. Autres exemples 4 2. Estimateurs 4 2.1. Définition générale 4 2.2. Consistance, No Free Lunch 5 2.3. Exemples : Estimateurs par minimum de contraste 5 2.4. Exemple : Estimateurs des moindres carrés ...
متن کاملClassification des actions humaines basée sur les descripteurs spatio-temporels
Résumé. Dans cet article, nous proposons un nouveau descripteur spatio-temporel appelé ST-SURF pour l’analyse et la reconnaissance d’actions dans des flux vidéo. L’idée principale est d’enrichir le descripteur Speed Up Robust Feature (SURF) en intégrant l’information de mouvement issue du flot optique. Seuls les points d’intérêts qui ont subi un déplacement sont pris en compte pour générer un d...
متن کاملSélection de modèles et sélection d’estimateurs pour l’Apprentissage statistique (Cours Peccot) Troisième cours: Rééchantillonnage et pénalisation
1. Régressogrammes en régression hétéroscédastique 2 1.1. Cadre de la régression hétéroscédastique 2 1.2. Régressogrammes 2 1.3. Exemples de collections de partitions 4 1.4. Pénalité idéale 4 2. Nécessité d’estimer la forme de la pénalité 7 2.1. Illustration sur un exemple 7 2.2. Caractérisation des pénalités fonction de la dimension 8 2.3. Sous-optimalité des pénalités fonction de la dimension...
متن کاملSélection d’a priori et géométrie de l’information
Dans cette contribution, nous étudions le problème de la sélection de distribution a priori dans le contexte de la théorie bayésienne. La litérature sur le sujet est abondante et le problème est loin d’être définitivement résolu [1]. Nous revisitons cette problématique avec les outils de la géométrie différentielle pour proposer une construction de l’a priori dans le cadre de la théorie bayésie...
متن کامل